#aprendizaje por imitación

Métricas de curación fallan en defectos estructurales de políticas de imitación

Las métricas de curación solo-acción fallan ante defectos estructurales en demostraciones. Incluso las mejores solo recuperan un tercio del rendimiento.

2026-06-05 · 3 min

Auditoría de métricas de curación: las de solo acciones fallan en defectos estructurales

Las métricas de solo acciones no detectan defectos estructurales clave en demonstraciones. Un estudio revela que solo métricas de trayectoria de estado mejoran

2026-06-05 · 2 min

LadderMan: Escalada de robots humanoides con percepción

LadderMan: robots humanoides escalan escaleras y manipulan objetos. Sistema híbrido de aprendizaje y visión por IA. Transferencia sim-to-real sin ajustes.

2026-06-05 · 3 min

Condicionamiento del éxito: problema de optimización al imitar el éxito

El condicionamiento del éxito optimiza políticas imitando aciertos. Aprende la teoría y su aplicación en IA.

2026-06-04 · 3 min

Instant-Fold: Aprendizaje por imitación en contexto para objetos deformables

Descubre Instant-Fold: robots manipulan objetos deformables con una sola demostración humana, sin necesidad de entrenamiento adicional. Aprende cómo.

2026-06-04 · 2 min

SPADE: Planificación de trayectorias guiada por bocetos con difusión

Descubre SPADE, el nuevo método que combina bocetos y difusión para planificar rutas de robots móviles con un 39% menos de error y un 93% menos parámetros.

2026-06-03 · 2 min

Zumbar, Elegir, Olvidar: Marco Meta-Bandit para decisiones de abejas

Modelo MAYA basado en bandidos multi-brazo reproduce decisiones de forrajeo de abejas con memoria limitada. Ventana temporal óptima de 7 pruebas. ¡Lee más!

2026-06-03 · 2 min

Aprendizaje por imitación sin entrenamiento con políticas de difusión cerradas

Aprendizaje por imitación sin entrenamiento: políticas de difusión cerradas logran inferencia en tiempo real en CPU móvil con rendimiento competitivo.

2026-06-02 · 2 min

¿Cuándo supera la dinámica inversa predictiva a la clonación de comportamiento?

Los modelos de dinámica inversa predictiva superan a la clonación de comportamiento en eficiencia de muestras. Explicación teórica y validación empírica.

2026-06-02 · 2 min

HOIST: Humanoides optimizados para cargas suspendidas

Descubre cómo HOIST combina imitación y RL para que humanoides manipulen cargas suspendidas con alta precisión. Reduce errores de colocación en 19.9 cm.

2026-06-02 · 2 min

AffordGen: Demostraciones diversas para manipulación generalizable de objetos

AffordGen genera datos diversos para manipulación robótica con generalización zero-shot. Aumenta la eficiencia del aprendizaje por imitación.

2026-06-02 · 2 min

De videos humanos a manipulación robótica: aprendizaje VLA escalable

Descubre cómo los videos humanos entrenan robots con modelos VLA escalables. Encuesta sobre aprendizaje robótico con datos humanos.

2026-06-02 · 2 min

Política de Deriva Implícita: acciones en un paso con geometría condicional

IDP: genera acciones en un paso con corrección del entrenamiento usando geometría condicional de experto. Ideal para control robótico de alta frecuencia.

2026-06-02 · 2 min

SWIM: Imitación de cuerpo completo para natación

SWIM: nuevo método de imitación para animación de natación. Aprende de un solo movimiento, se adapta a entornos y estilos. Eficiente, robusto y generalizable.

2026-06-01 · 3 min